I Love (meaningful) Data

George G. Vega Yon
http://cana.usc.edu/vegayon
@gvegayon
gvegayon @ github

8 de Noviembre, 2016

Overview

Data Scientist según Drew Conway

Hacking skills 1: Aprende a guardar datos

Hacking skills 2: Aprende un lenguaje de verdad

Superman lo sabia…

Superman lo sabia…

Pues en excel nunca podrás hacer esto!

Codigo de fuente: useRchile en Meetup

Hacking Skills 3: Aprende a leer (y escribir) datos

Ver el paquete rgexf para generar archivos GEXF (Graph Exchange XML Format) (15K descargas)

Hacking Skills 3: Aprende a leer (y escribir) datos (cont.)

(ver codigo aquí)

Puede ser replicado con googlePublicData (10K descargas).

Hacking Skills (bonus track): No seas tan “hacker”

Math and Statistical Knowledge 1: Aprende estadistica (de verdad)

Math and Statistical Knowledge 2: Aprende estadistica (de verdad… por favor)

Correlación != Causalidad

Math and Statistical Knowledge 3: Piensa dentro de la caja\(^1\)

\(^1\): Blog de Dirk Eddelbuettel, Thinking Inside the Box (autor de Rcpp+friends)

Math and Statistical Knowledge 3: Piensa dentro de la caja

No sólo estadística, también:

También:

parallel en Stata Conference 2012 (Nueva Orleans)

Substantive Expertise 1: Todo suma (APIs+regex+stats+viz)

Projecto twitterreport (en github: vegayon/twitterreport)

Substantive Expertise 2: Todo suma (Rcpp+Big data+R graphics:: :])

Presentacion del paquete netdiffuseR (1.3K descargas) en useR2016!

Substantive Expertise 3: Todo suma (smooth scatterplots+stats)

Fuente: Vega, George G. & Valente, Thomas W., Visualizing Large Annotated Graph as Heatmaps (working paper)

Conectando los puntos…

Steve Jobs, Comencement address at Stanford (2005)

Steve Jobs, Comencement address at Stanford (2005)

Ver video aquí

Recapitulando

Hacking skills:

Math and Statistical Knowledge:

Substantive Expertise:

Algunos consejos finales

Algunos consejos finales (cont.)

Pero no te obsesiones tanto…

// 
// Dear maintainer:
// 
// Once you are done trying to 'optimize' this routine,
// and have realized what a terrible mistake that was,
// please increment the following counter as a warning
// to the next guy:
// 
// total_hours_wasted_here = 42
// 

Publicado en Stackoverflow#18416

Algunos consejos finales (cont.)

Gracias!

Preguntas?

George G. Vega Yon
http://cana.usc.edu/vegayon
@gvegayon
gvegayon @ github